使用 Python 搭建简易版AlphaGo

__William__

于 2017-01-13 13:31:58 发布

阅读量1.7w

点赞数 2

分类专栏： Machine Learning 文章标签： Machine Learning 机器学习 TensorFlow 深度学习 AlphaGo

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/willduan1/article/details/54311778

版权

本文介绍如何使用Python和TensorFlow搭建简易版AlphaGo，基于MuGo开源项目。首先，确保安装TensorFlow，然后下载并预处理SGF围棋文件。预处理过程中可能需要安装额外的库。接着，利用策略网络进行监督学习，可以选择原始策略网络或蒙特卡洛搜索树策略。详细步骤和参考资料提供给读者进一步探索。

摘要由CSDN通过智能技术生成

本博文使用的是GitHub上的MuGo开源程序，使用的是纯Python语言，主要是AlphaGo的一个复制的版本。项目的地址请看后面的参考文献部分。

AlphaGo主要使用了三个神经网络，即第一个速度缓慢但是准确的蒙特卡洛搜索树，主要用来预测人来的棋子的移动。第二个主要是小的一个策略网络但是速度很快。第三个是一个价值网络，只是用来计算胜率的不能用来预测棋子的移动。具体的看下面参考文献列出来的Google的paper。

废话了这么多，下面我们就开始操作纯Python版的简易AlphoGo吧。

1. 首先是安装好TensorFlow，安装教程这里就不多说了，具体的看这个链接：https://www.tensorflow.org/get_started/os_setup

2. 下载SGF文件并且预处理，可以在这个网址上面下载最近15年的围棋文件：https://u-go.net/gamerecords/

3. 预处理SGF文件，在与处理的时候可能会提示缺少例如sgf 包，gtp包之类的，用pip对应的安装上去就可以了。

python main.py preprocess ~/kgs-19-2016-12-new/

这里的 ~/kgs-19-2016-12-new/ 的意思是我上面下载下来的SGF文件，用unzip解压之后的文件夹为 kgs-19-2016

最低0.47元/天解锁文章

关注

2
点赞
踩
20

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

__William__ CSDN认证博客专家 CSDN认证企业博客

码龄13年

64: 原创

6万+: 周排名

162万+: 总排名

101万+: 访问

: 等级

6086: 积分

194: 粉丝

380: 获赞

117: 评论

1558: 收藏

私信

关注

热门文章

分类专栏

杭电OJ 3篇
杂谈 11篇
Android 3篇
struts 2篇
struts2 2篇
leetcode 35篇
推荐算法及系统 1篇
Machine Learning 17篇

最新评论

基于深度学习的色情视频鉴定
2401_82990522: cd open_nsfw
基于深度学习的色情视频鉴定
2401_82990522: docker build -t caffe:cpu https://raw.githubusercontent.com/BVLC/caffe/master/docker/cpu/Dockerfile
深度学习优化算法解析(Momentum, RMSProp, Adam)
帅翰GG: 我和您交流一下，我认为在关于RMSprop那一部分说的不是很准确：“虽然初步解决了优化中摆动幅度大的问题。所谓的摆动幅度就是在优化中经过更新之后参数的变化范围，如下图所示，蓝色的为Momentum优化算法所走的路线，绿色的为RMSProp优化算法所走的路线。”这句话。实际上RMSprop算法与动量梯度下降本质上都是为了解决减缓纵坐标方向上的波动幅度，增大或至少不减慢横坐标的速度，从而达到加速梯度下降的目的。二者只是侧重点不同，动量梯度下降侧重的是模拟物理动量概念，增加更新在同一方向上的持续性和稳定性。而RMSProp侧重是调整学习率，让学习率在各个方面自适应。而您说的那个蓝色的线，其实还是吴恩达老师说的 min-batch梯度下降的效果
集成学习总结 & Stacking方法详解
冯诺依曼关门弟子: 感觉应该是 pred = lgb.predict(xxxxxx) 训练完lgb之后，用lgb.predict()就可吧应该。没有试过，感觉应该是这样~
集成学习总结 & Stacking方法详解
ZZ997241791: 哥，解决了吗，我没想明白怎么进行新数据的预测

大家在看

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。